Definire lo Standard d'Oro: MSE
Per misurare quanto la nostra stima $T$ si discosti dalla realtà $\psi(\theta)$, definiamo Errore Quadratico Medio (Definizione 6.3.1):
$$MSE_\theta(T) = E_\theta((T - \psi(\theta))^2)$$
Questo è la distanza quadratica media tra lo stimatore e il valore target. Uno stimatore perfetto avrebbe un MSE pari a zero, ma in un mondo caratterizzato da rumore casuale, ci impegniamo a minimizzarlo.
Teorema 8.1.1: L'Architettura dell'Errore
Perché uno stimatore fallisce? Il Teorema 8.1.1 fornisce il progetto. Se $T$ ha un secondo momento finito, l'errore rispetto a una costante qualsiasi $c$ è dato da:
Questa formula rivela che l'errore quadratico totale è minimizzato solo quando scegliamo $c = E(T)$. Nel contesto dell'inferenza, fissiamo $c = \psi(\theta)$, portando alla celebre decomposizione:
MSE = Varianza + Errore di distorsione$^2$
Il Compromesso tra Precisione e Accuratezza
Immagina due bilance in un laboratorio di controllo qualità:
- Il Relitto Preciso: Dà sempre lo stesso peso (bassa varianza), ma è fuori taratura di 2 grammi (alto errore di distorsione).
- Il Saggio Erratico: È corretto in media (errore di distorsione nullo), ma oscilla violentemente tra le misurazioni (alta varianza).
Il Teorema 8.1.1 ci permette di calcolare esattamente quale bilancia fornisca un errore totale più basso. Spesso siamo disposti ad accettare una piccola deviazione sistematica (errore di distorsione) se riduce drasticamente il rumore (varianza).
Esempio 8.1.1: Sufficienza e Informazione
L'ottimalità è legata a Informazione. Considera uno spazio campionario $S = \{1, 2, 3, 4\}$. Se gli esiti 2, 3 e 4 sono ugualmente probabili per ogni possibile parametro, essi portano la stessa verosimiglianza. Possiamo definire una statistica sufficiente $U$ che raggruppa questi esiti senza perdere alcuna capacità di effettuare un'inferenza ottimale. Come mostrato nella simulazione, se $L(\cdot|2) = L(\cdot|3) = L(\cdot|4)$, uno stimatore ottimale li tratta come un singolo evento informativo.